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Procede de codage mujtijalg. oigftimiise 

La presente invention concerne le codage/decodage de signaux numeriques, 
dans des applications de transmission ou de stockage de signaux multimedia 
tels que les signaux audio (parole et/ou sons) ou video. 

Pour offrir mobilite et continuity les services de communication multimedia 
modernes et innovants doivent pouvoir fonctionner dans une grande variete de 
conditions. Le dynamisme du secteur de la communication multimedia, 
I'heterogeneite des reseaux, de I'acces et des terminaux ont engendre une 
proliferation de formats de compression. 

La presente invention s'inscrit dans le contexte d'une optimisation des 
techniques de "codage multiple", mises en oeuvre des lors qu'un signal 
numerique, ou une portion de ce signal, est code selon plusieurs techniques 
de codage. Ce codage multiple peut etre effectue de maniere simultanee (en 
une seule passe) ou non. Les traitements peuvent s'effectuer sur le meme 
signal, ou eventuellement sur des versions derivees du meme signal (par 
exemple selon des bandes passantes differentes). On distingue done le 
"codage multiple" des "transcodages" , ou chaque codeur effectue la 
compression d'une version issue du decodage du signal compresse par le 
codeur precedent. 

Le codage multiple se presente par exemple dans le cas d'un meme contenu 
qui est code selon plusieurs formats et transmis ensuite a des terminaux ne 
supportant pas les memes formats de codage. S'il s'agit d'une diffusion en 
temps reel, le traitement devra etre effectue en simultane. S'il s'agit d'acces a 
une base de donnees, les codages pourront etre effectues I'un apres I'autre, 
en differe. Dans ces exemples, le codage multiple permet de coder un meme 
signal selon des formats differents en utilisant plusieurs codeurs (ou 
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eventuellement plusieurs debits ou plusieurs modes d'un meme codeur), 
chaque codeur fonctionnant de maniere independante des autres codeurs. 

Un autre usage de codage multiple se rencontre dans des structures de 
codage ou plusieurs codeurs se trouvent en competition pour coder un 
segment de signal, un seul codeur etant finalement selectionne pour le codage 
de ce segment. Le choix du codeur selectionne peut s'effectuer a Tissue du 
traitement de ce segment, voire meme ulterieurement (par decision retardee). 
Dans ce qui suit, on designera par "codage multi-modes" ce type de structure 
(en reference a la selection d'un "mode" de codage). Dans ces structures 
multi-modes, plusieurs codeurs partageant un "passe commun" sont amenes a 
coder la meme portion de signal. Les techniques de codage utilisees peuvent 
§tre differentes, ou issues d'une unique structure de codage. Elles ne seront 
cependant pas totalement independantes sauf s'il s'agit de techniques "sans 
memo/re". En effet, dans le cas (courant) de techniques de codage mettant en 
oeuvre des traitements recursifs, le traitement d'un segment donne de signal 
depend de la maniere dont ce signal a ete code dans le passe. II y a done une 
certaine dependance entre les codeurs, des lors qu'un codeur devra prendre 
en compte dans ses memoires la sortie d'un autre codeur. 

Dans ces differents contextes, la notion de "codage multiple" a ete introduite 
ainsi que les conditions d'usage de telles techniques. Cependant la complete 
de mise en ceuvre peut s'averer redhibitoire. 

Par exemple, dans le cas de serveurs de contenus qui diffusent un meme 
contenu sous plusieurs formats adaptes aux conditions d'acces, de reseaux et 
terminaux de differents clients, cette operation devient extremement complexe 
a mesure qu'augmente le nombre de formats desire. S'il s'agit d'une diffusion 
temps reel, on se trouve rapidement limite par les ressources du systeme etant 
donne que les differents formats sont codes en parallele. 



WO 2005/066938 



PCT/FR2004/003009 



10 



15 



20 



25 



30 



Le deuxieme cas d'usage mentionne concerne les applications de codage 
multi-modes, permettant la selection d'un codeur parmi un ensemble pour 
chaque portion de signal analyse. La selection demande la definition d'un 
critere, les plus courants visant a i'optimisation du compromis debit-distors.on. 
Le signal etant analyse sur des segments temporels successifs, a chaque 
segment plusieurs codages sont evalues. On selectionne ensuite le codage de 
debit le plus faible pour une qua.ite donnee, ou celui de meilleure qualite pour 
un debit donne. On notera que d'autres contraintes que celles de 
debit/distorsion peuvent etre utilisees. 

En general, dans de telles structures, la selection du codage s'effectue "a 
priori ' par une analyse du signal sur le segment considere (selection selon les 
caracteristiques du signal). Cependant, la difficult* de produire une 
classification robuste du signal pour cette selection a conduit a proposer une 
selection "a posteriori' du mode optimal apres codage de I'ensemble des 
modes, au prix toutefois d'une complexite elevee. 

Des methodes interm§diaires combinant les deux approches ont ete 
proposees pour alleger le coOt de calcul. Ces strategies sont cependant sous- 
optimales et s'averent moins performantes que I'exploration de tous les 
modes. L'exploration de tous les modes ou d'une grande partie des modes 
constitue une application de codage multiple qui presente une complexite 
potentietlement elevee, difficilement compatible a priori avec le codage en 
temps reel par exemple. 

Actuellement, la plupart des operations de codage multiple et de transcodage 
ne prennent pas en compte les interactions entre les formats et entre le format 
et son contenu. Quelques techniques de codage multi-modes ont ete 
proposees, mais la decision du mode utilise se fait generalement a prior. so,t 
sur le signal (par classification, comme par exemple le codeur SMV pour 
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"Selectable Mode Vocoder"), soit en fonction des conditions du reseau (par 
exemple dans les codeurs AMR pour "Adaptive Multi-Rate"). 

Dans les documents : 

"An overview of variable rate speech coding for cellular networks", Gersho, A.; 
Paksoy, E.; Wireless Communications, 1992. Conference Proceedings, 1992 
IEEE International Conference on Selected Topics, 25-26 Jun 1992 Page(s) : 
172 -175, 

, "A variable rate speech coding algorithm for cellular networks", Paksoy, E.; 
Gersho, A.; Speech Coding for Telecommunications, 1993. Proceedings, IEEE 
Workshop 1993, Page(s): 109-110, 

"Variable rate speech coding for multiple access wireless networks", Paksoy 
5 £.; Gersho A.; Electrotechnical Conference, 1994, Proceedings, 7th 
Mediterranean, 12-14 Apr 1994 Page(s): 47 -50 vol.1, 

plusieurs modes de selection sont presentes, en particulier une decision 
contr6lee par la source et une decision controlee par le reseau. 

!0 . . 

Dans le cas d'une decision contr6lee par la source, la decision a prion 
s'effectue a partir d'une classification du signal d'entree. II existe alors de 
nombreuses methodes de classification du signal. 

25 Dans le cas d'une decision contrdlee par le reseau, il est plus simple de 
realiser un codeur multi-modes dont le debit est choisi par un module externe 
phitflt que par la source. La methode la plus simple consiste a elaborer une 
famille de codeurs chacun a debit fixe mais dont les debits sont differents 
entre codeurs et de commuter entre ces differents debits pour obtenir un mode 

30 courant desire. 
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Quelques travaux ont aussi ete presentes sur la possibility de combiner 
plusieurs criteres pour selectionner a priori le mode qui doit etre util.se, 
notamment dans les documents : 

"Variable-rate for the basic speech service in UMTS' Berruto, E.; Sereno, D.; 
Vehicular Technology Conference, 1993 IEEE 43rd, 18-20 May 1993 Page(s): 
520 -523 

«A VR-CELP codec implementation for CDMA mobile communications" 
Cellario, L; Sereno, D.; Giani, M.; Blocher, P.; Hellwig, K .; Acoustics, Speech, 
, and Signal Processing, 1994, lCASSP-94, 1994 iEEE International 
Conference, Volume: 1 , 19-22 Apr 1994 Page(s): 1/281 -I/284 vol.1. 

Tous les algorithmes de codage multi-modes avec selection du mode de 
codage a priori souffrent d'un meme inconvenient, en particulier lie a des 
5 problemes de robustesse de la classification a priori. 

C'est pourquoi des techniques utilisant une decision a posteriori du mode de 
codage ont ete proposees. Par exemple dans le document : 

, 0 "Finite state CELP for variable rate speech coding" Vaseghi, S.V .; Acoustics, 
Speech, and Signal Processing, 1990, ICASSP-90, 1990 International 
Conference, 3-6 Apr 1990 Page(s) : 37 -40 vol.1, 

le codeur peut commuter entre differents modes par optimisation d'une mesure 
25 de qualite objective, la decision se fait done a posteriori en fonction des 
caracteristiques du signal d'entree, du rapport vise debit/SQNR (pour "Signal 
to Quantization Noise Ratio") et de I'etat courant du codeur. Un tel schema de 
codage permet d'obtenir une amelioration de la qualite. Cependant, les 
differents codages etant realises en parallele, la complete resultante de ce 
30 type de systeme est prohibitive. 
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D'autres techniques combinant une decision a priori et une amelioration en 
boucle fermee ont ete proposees. Dans le document : 

"Multimode variable bit rate speech coding: an efficient paradigm for high- 
quality low-rate representation of speech signar Das, A.; DeJaco, A.; 
Manjunath, S.; Ananthapadmanabhan, A; Huang, J.; Choy, E.; Acoustics, 
Speech, and Signal Processing, 1999. ICASSP '99 Proceedings, 1999" IEEE 
International Conference, Volume: 4, 15-19 Mar 1999 Page(s): 2307 -2310 
vol.4, 

le systeme propose effectue une premiere selection (selection en boucle 
ouverte) du mode, en fonction des caracteristiques du signal. Cette decision 
peut etre effectuee par classification. Ensuite, a partir d'une mesure d'erreur, si 
les performances du mode selectionne ne sont pas satisfaisantes, un mode de 
debit plus eleve est applique et I'operation se repete (selon une decision 
recherchee en boucle fermee). 

De meme, dans les documents : 

* "Variable rate speech coding for umts" Cellario, L; Sereno, D.; Speech 
Coding for Telecommunications, 1993. Proceedings, IEEE Workshop, 1993 
Page(s): 1 -2 

"Phonetically-based vector excitation coding of speech at 3.6 kbps" Wang, S.; 
Gersho, A; Acoustics, Speech, and Signal Processing, 1989. ICASSP-89., 
1989 International Conference, 23-26 May 1989 Page(s): 49 -52 vol.1 

* "A modified CS-ACELP algorithm for variable-rate speech coding robust in 
noisy environments" Beritelli, F.; IEEE Signal Processing Letters, Volume: 6 
Issue: 2, Feb 1999 Page(s): 31 -34, 
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des techniques similaires ont ete utilisees. Une premiere selection en boucle 
ouverte est realisee apres classification du signal d'entree (classif,cat,on 
phonetique, ou voise/non-voise), ensuite une decision en boucle fermee est 
effectuee: 

- soit sur le codeur complet et, dans ce cas, tout le segment de parole est 
code & nouveau; 

- - soit sur une partie du codage, comme dans les references ci-avant 
precedees d'une etoile (*), pour lesquels le choix du dictionna.re a 
utiliser est effectue en boucle fermee. 

L'ensemble des etudes mentionnees ci-dessus tend a resoudre le probleme de 
,a complexite de la selection optimale du mode par I' utilisation, totale ou 
partielle, d'une selection ou pre-selection a priori, qui evite le codage mult.ple 
ou diminue le nombre de codeurs a mettre en ceuvre en parallels 

Toutefois, aucune technique de Part anterieur permettant de reduire la 
complexite des codages realises en parallele n'a ete proposee. 

La presente invention vient ameliorer la situation. 

Elle propose a cet effet un precede de codage multiple en compression, dans 
,equel un signal d'entree est destine a alimenter en parallele une p.ura.ite de 
codeurs comportant chacun une succession de blocs fonctionnels, en vue d'un 
codage en compression dudit signal par chaque codeur. 

Le precede de ('invention comporte les etapes preparatoires ci-apres : 

a) identifier les blocs fonctionnels formant chaque codeur, ainsi qu'une ou 
plusieurs fonctions realis6es par chaque bloc, 

b) reperer, parmi lesdites fonctions, des fonctions qui sont communes d'un 
30 codeur a I'autre, et 



WO 2005/066938 



PCT7FR2004/003009 



8 



c) executor lesdites fonctions communes, une fois pour toutes, pour une partie 
au moins de tous les codeurs, au sein d'au moins un meme module de calcul. 

Dans une realisation avantageuse, les etapes ci-avant sont mises en oeuvre 
5 par un produit programme d'ordinateur comportant des instructions de 
programme a cet effet. A ce titre, la presente invention vise aussi un tel produrt 
programme d'ordinateur, destine a etre stocke dans une memoire d'une-unite - 
de traitement, notamment d'un ordinateur ou d'un terminal mobile, ou sur un 
support memoire amovible et destine a cooperer avec un lecteur de I'unite de 
io traitement 

La presente invention vise aussi un dispositif d'aide a un codage en 
compression, pour la mise en ceuvre du precede selon Invention, et 
comportant alors une memoire propre a stacker des instructions d'un produrt 
15 programme d'ordinateur du type precite. 

D'autres caracteristiques et avantages de Invention apparaTtront a I'examen 
de la description detaillee ci-apres, et des dessins annexes sur lesquels : 

la figure 1a illustre schematiquement le contexte d'application de la 
2 o presente invention, avec une pluralite de codeurs mis en parailele, 

la figure 1b illustre schematiquement Implication de I'invention, avec la 

mise en partage de blocs fonctionnels entre plusieurs codeurs mis en 

parailele, 

la figure 1c illustre schematiquement l'application de I'invention, avec la 
25 mise en partage de blocs fonctionnels en codage multi-modes, 

la figure 1d illustre schematiquement l'application de I'invention, en codage 
multi-modes en treillis, 

la figure 2 represente schematiquement les blocs fonctionnels principaux 
d'un codeur frequentiel perceptuel, 
30 - la figure 3 represente schematiquement les blocs fonctionnels principaux 

d'un codeur a analyse par synthese, 
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- la figure 4a represente schematiquement les blocs fonctionnels principaux 
d'un codeur TDAC, 

- la figure 4b represente schematiquement le format du flux binaire code par 

le codeur de la figure 4a, 
5 - la figure 5 represente schematiquement I'application de I'invention a une 
pluralite de codeurs TDAC en parallele, selon une realisation avantageuse, 
la figure 6a represente schematiquement les blocs fonctionnels principaux 
d'un codeur MPEG-1 (layer I et II), 
. la figure 6b represente schematiquement le format du flux binaire code par 

io le codeur de la figure 6a, 

- la figure 7 represente schematiquement I'application de I'invention a une 
pluralite de codeurs MPEG-1 (layer I et II) mis en parallele, selon une 

realisation avantageuse, 

- et la figure 8 represente plus en details les blocs fonctionnels d'un codeur a 
15 analyse par synthese, ici de type NB-AMR selon la norme 3GPP. 

On se refere tout d'abord a la figure 1a sur laquelle on a represente une 
pluralite de codeurs CO, C1, .... CN, en parallele et recevant chacun un signal 
d'entree s 0 . Chaque codeur comporte des blocs fonctionnels BF1 a BFn pour 
20 mettre en ceuvre des etapes successes de codage et delivrer finalement un 

flux binaire code BS0, BS1 BSN. On indique en outre que dans une 

application en codage multi-modes, les sorties des codeurs CO a CN sont 
reliees a un module MM de selection du mode optimal et le flux binaire BS du 
codeur optimal est transmis (fleches en traits pointilles de la figure 1a). 

Pour une raison de simplicite, tous les codeurs de I'exemple de la figure 1 a ont 
le meme nombre de blocs fonctionnels, mais bien entendu tous ces blocs 
fonctionnels ne sont pas necessairement prevus dans tous les codeurs, en 
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Certains blocs fonctionnels BFi sont parfois idehtiques d'un mode (ou d'un 
codeur) a I'autre, d'autres ne different qu'au niveau des quantificateurs. Des 
relations exploitables existent aussi lorsque I'on utilise des codeurs issus d'une 
meme famille de codage, utilisant des modeles similaires ou calculant des 
parametres lies physiquement au signal. 

Ce sont ces- relations que la presente invention propose d'exploiter.afin de 
reduire la complexite des operations de codage multiple. 

Dans un premier temps, I'invention propose d'identifier les blocs fonctionnels 
composant chacun des codeurs. On exploite ensuite les similarity techniques 
entre les codeurs en considerant les blocs fonctionnels dont les fonctions sont 
6quivalentes ou voisines. Pour chacun de ces blocs, I'invention propose : 
o d'une part de definir des operations dites "communed, et de les 
5 effectuer une seule fois pour I'ensemble des codeurs; 

o d'autre part, de mettre en ceuvre des methodes de calcul specifiques a 
chaque codeur et utilisant notamment les resultats de ces calculs 
communs. Ces methodes de calcul produisent un resultat 
Sventuellement different de celui produit par un codage complet. 
20 L'objectif est alors en fait d'accelerer les traitements en exploitant les 

informations disponibles et fournies notamment par les calculs 
communs. De tels precedes permettant d'accelerer les calculs sont par 
exemple mis en ceuvre dans des techniques destinees a reduire la 
complexite des operations de transcodage (dites techniques de 
25 "transcodage intelligent'). 

La figure 1b illustre la solution proposee. Dans I'exemple represente, les 
operations "communes" precitees sont effectuees une seule fois pour une 
partie au moins des codeurs et, preferentiellement, pour I'ensemble des 
30 codeurs, dans un module independant Ml qui redistribuera les resultats 
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obtenus a une partie au moins des codeurs, ou preferentiellement a tous ces 
codeurs. II s'agit ainsi d'une mise en partage entre une partie au moins de tous 
les codeurs CO a CN (ou "mutualisation" ci-apres) des resultats obtenus. Un tel 
module independant Ml peut faire partie d'un dispositif d'aide a un codage 
multiple en compression tel que defini ci-avant. 

Dans une variante avantageuse, plutdt que d'avoir recours a un module de 
calcul externe Ml, on utilise le ou les blocs fonctionnels existants BF1 a BFn 
d'un meme ou de plusieurs codeurs distincts, ce ou ces codeurs etant choisis 
selon des criteres qui seront decrits plus loin. 

La presente invention peut mettre en oeuvre plusieurs strategies qui, bien 
entendu, peuvent differer selon le r6le du bloc fonctionnel considere. 

Une premiere strategie consiste a utiliser les parametres du codeur dont le 
debit est le plus faible pour focaliser la recherche des parametres pour tous les 
autres modes. 

A I'inverse, une deuxieme strategie consiste a utiliser les parametres du 
codeur dont le debit est le plus eleve, puis de "d4gradet" progressivement 
jusqu'au codeur dont le debit est le plus faible. 

Bien entendu, si Ton souhaite privilegier un codeur particulier, ii est possible de 
coder un segment de signal en utilisant ce codeur, puis, en appliquant les 
deux strategies ci-avant, d'atteindre les codeurs de debit superieur et inferieur. 

Bien entendu, d'autres criteres que le debit peuvent etre utilises pour piloter la 
recherche. On peut par exemple, pour certains blocs fonctionnels, favoriser le 
codeur dont les parametres se pretent le mieux a une extraction (ou une 
analyse) et/ou a un codage efficaces des parametres similaires des autres 
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oodeurs, refficacite pouvant etre jugee selon la complexity, la gualite ou un 
compromis des deux. 

„ paut etre prevu aussi de creer un module de codage independent, non 
p,Lnt dans ,es oodeurs, mais permattan. un codage plus efficace des 
parametres du bloo fonctionne. consider*, pour .'ensemble des oodeurs. 

Ces dlverses strategy de mise en cauvre sent particulierement interessantes 
a s e oas du codage multi-modes. Dans ce contexts illustre a * figure 
p^sente invent perme. de rSduire la compete des oalculs pre,,m™r« * 
I setecfion a posteriori d-un oodeur effecfuee en dernlere etape par example 
par le dernier module MM avant la transmission du flux binarre BS. 

Dans ce oas particulier du codage multi-modes, una variante de la presente 
°ZZ repLn.ee dans rexempte de la figure 1o. propose tf in,rodu,re un 

ZZ de s Lotion partial* MSPi (aveo i = 1 . 2 N) apr*s chague y , de 

Todage (done apres les blocs foncfionnels BFM a BFIN, mis en compete e« 
don e l»a, du ou des blocs selects BRcc va Stre ufilise par la su«e) 
Z las simiKudes entre te s different* modes son, exploitees pour accalere 
7il de cbague bloc fonctlonne.. Tous les schemes de codage ne saront 
alors pas obligatoirement evalues. 

Une variante plus sophisfiguee de la structure multi-modas reposanl tsur la 
d ,coupe an blocs foncfionnete decrife c,avan, est rnaintenan, , osee. en 
reference a la figure 1d. U strucarre multi-modes de la figure 1d est d,te en 
t Z " avec plusiaurs cbemins possibles dans le Mb. En fait, sur .a figure 
1 on a rep esent, tous tes chemins possibles du .re* de sorte gu',1 se 
plente so s una forma arborescenfe. On Indigue en partlculier gue chague 
o el du trairas est d« par une comblnaison de modes de fonctionnemen 
oeTblocs foncfionnels, chagua bloc foncfionna, a.imentant plusteurs vanantes 
possibles du bloc fonctionnel suivant. 
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Ainsi, chaque mode de codage est issu de la combinaison de modes de 
fonctionnement des blocs fonctionnels : le bloc fonctlonnel 1 possede Ni 
modes de fonctionnement, le bloc fonctionnel 2 en possede N 2 , et ainsi de 
suite jusqu'au bloc P. L'ensemble des NN* Ni x N 2 x ... x N p combinaisons 
possibles est done represent par un treillis de NN branches decrivant, bout-a- 
bout, un codeur multi-modes complet a NN modes. On peut eventuellement 
supprimer a priori certaines branches du treillis et definir ainsi une 
arborescence comportant un nombre reduit de branches. Une premiere 
particularite de cette structure est qu'elle prevoit, pour un bloc fonctionnel 
donne, un module de caiculs communs par sortie du bloc fonctionnel 
precedent. Ces modules de caiculs communs effectuent les memes 
operations, mais sur la base de signaux differents puisqu'ils sont issus de 
blocs anterieurs differents. Avantageusement, les modules de caiculs 
communs d'un meme niveau sont mutualises : les resultats d'un module donne 
exploitables par les modules suivants sont fournis a ces modules suivants. 
D'autre part, une selection partielle, effectuee a Tissue du traitement de 
chaque bloc fonctionnel, permet avantageusement de supprimer les branches 
les moins performantes selon le critere choisi. On peut done reduire le nombre 
> de branches du treillis a evaluer. 



Une application avantageuse de cette structure multi-modes en treillis est la 
suivante. 

Lorsque les blocs fonctionnels sont susceptibles d'operer a des debits 
5 respectifs differents et en utilisant des parametres respectifs propres auxdits 
debits, pour un bloc fonctionnel donne, le chemin du treillis choisi est celui 
traversant le bloc fonctionnel de debit le plus faible, ou encore le bloc 
fonctionnel de debit le plus eleve selon le contexte de codage, et les resultats 
obtenus du bloc fonctionnel de debit le plus faible (ou le plus eleve) sont 
o adaptes aux debits d'une partie au moins des autres blocs fonctionnels par 
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une recherche focalisee de parametres pour une partie au moins de tous les 
autres blocs fonctionnels, jusqu'au bloc fonctionnel de debit le plus eleve (ou 
respectivement le plus faible). 

En variante, on choisit un bloc fonctionnel de debit donne et on adapte 
progressivement au moins une partie des parametres propres a ce bloc 
fonctionnel : 

- jusqu'au bloc fonctionnel capable d'operer au debit le plus faible, par 

recherche focalis6e, et 

- jusqu'au bloc fonctionnel capable d'operer au debit le plus eleve, par 

recherche focalisee. 

De maniere generate, on reduit ainsi la complexity associee au codage 
multiple. 

L'invention s'applique a tout schema de compression mettant en ceuvre le 
codage multiple d'un contenu multimedia. Trois exemples de realisation sont 
presentes dans ce qui suit, dans le domaine de la compression audio (parole 
et son). Les deux premiers exemples de realisation se situent dans le contexte 
de la famille des codeurs par transformee, dont on peut donner le document 
suivant a titre de reference : 

"Perceptual Coding of Digital Audio", Painter, TV, Spanias, A.; Proceedings of 
the IEEE, Vol. 88, No 4, April 2000. 

Le troisieme exemple de realisation se situe dans le contexte des codeurs 
CELP, dont on peut donner le document suivant a titre de reference : 
"Code Excited Linear Prediction (CELP): High quality speech at very low bit 
rates" Schroeder M.R.; Atal B.S.; Acoustics, Speech, and Signal Processing, 
1985. Proceedings. 1985 IEEE International Conference, Page(s): 937-940. 
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Un rappel des principales caracteristiques de ces deux families de codage est 
tout d'abord presente dans ce qui suit. 

* Les codeurs par transforms® ou en sous toanides 

II s'agit de codeurs en compression par transformee ou en sous bandes bases 
sur des criteres psychoacoustiques. Ce type de codeur procede par 
transformation sur des blocs du signal tempore! pour obtenir un ensemble de 
coefficients. Les transformations sont du type temps-frequence, Tune des 
transformations les plus utilisees etant la transformee en cosinus discrete 
modifiee (dit "MDCT\ de I'anglais "Modified Discrete Cosine Transform"). 
Avant la quantification de ces coefficients, un algorithme procede a rallocation 
des bits de fagon a ce que le bruit de quantification soit le moins audible 
possible. L'allocation binaire et la quantification des coefficients mettent en 
ceuvre une courbe de masquage, obtenue a Paide d'un modele 
psychoacoustique permettant d'evaluer, pour chaque raie spectrale 
consideree, un seuil de masquage representatif de I'amplitude necessaire pour 
qu'un son a cette frequence soit audible. La figure 2 donne le schema de 
principe d'un codeur frequentiel. On remarquera que la structure sous forme 
de blocs fonctionnels est bien representee. En se referant a la figure 2, les 
blocs fonctionnels principaux sont : 

- un bloc 21 de transformation temps/frequence du signal 

audionumerique d'entree s 0 , 

- un bloc 22 de determination d'un modele perceptuel a partir du signal 

transforms, 

- un bloc 23 de quantification et codage, a partir du modele perceptuel, 

- et un bloc 24 de formatage du flux binaire pour obtenir une trame audio 
codee stc. 

* Les codeurs a anallyse par synthese (codage CELP) 

Dans les codeurs a analyse par synthese, le modele de synthese du signal 

reconstruit est utilise au codeur pour extraire les parametres modelisant les 
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signaux a coder. Ces signaux peuvent etre echantillonnes a la frequence de 8 
kHz (bande telephonique 300-3400 Hz) ou a une frequence plus elevee, par 
exemple a 16 kHz pour le codage en bande elargie (bande passante de 50Hz 
a 7 kHz). Selon I'application et la qualite desiree, le taux de compression varie 
5 de 1 a 16. Ces codeurs fonctlonnent a des debits de 2 a 16 kbit/s en bande 
telephonique, et a des debits de 6 a 32 kbit/s en bande elargie. Le dispositif de 
codage numerique de type CELP, codeur a analyse par synthese le ptus utilise 
actuellement, est presente a la figure 3 sous forme de blocs fonctionnels 
principaux. Le signal de parole s 0 est echantillonne et converti en une suite de 
io trames d'un nombre L d'echantillons. Chaque trame est synthetisee en filtrant 
une forme d'onde extraite d'un repertoire (appele "dictionnaire"), multipliee par 
un gain, a travers deux filtres variant dans le temps. Le dictionnaire d'excitation 
fixe est un ensemble fini de formes d'ondes des L echantillons. Le premier 
filtre est un filtre de prediction a long terme. Une analyse "LTP' (pour "Long 
15 Term Prediction") permet d'evaluer les parametres de ce predicteur a long 
terme qui exploite la period icite des sons voises, cette composante 
harmonique etant modelisee sous la forme d'un dictionnaire adaptatif 
(bloc 32). Le second filtre est un filtre de prediction a court terme. Les 
methodes d'analyse "LPC" (pour "Linear Prediction Coding") permettent 
d'obtenir ces parametres de prediction a court terme, representatifs de la 
fonction de transfert du conduit vocal et caracteristiques de I'enveloppe du 
spectre du signal. Le procede utilise pour determiner la sequence d'innovation 
est la methode d'analyse par synthese qui se resume comme suit. Au codeur, 
un grand nombre de sequences d'innovation du dictionnaire d'excitation fixes 
sont filtrees par le filtre LPC (filtre de synthese du bloc fonctionnel 34 de la 
figure 3). Au prealable, I'excitation adaptative a ete obtenue de facon similaire. 
La forme d'onde selectionnee est celle produisant le signal synthetique le plus 
proche du signal original (minimisation de I'erreur au niveau du bloc 
fonctionnel 35), selon un critere de ponderation perceptuelle (bloc fonctionnel 
30 36) qui est connu en general sous le nom de critere "CELP*. 
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Dans le schema de principe du codeur CELP donn§ a la figure 3, Pextraction 
de la frequence fondamentale des sons vois6s (ou "pitch"), appliqu^e sur le 
signal resultant de Tanalyse LPC du bloc 31, permet ensuite d'en extraire la 
correlation a long terme au niveau du bloc 32, appelee composante 
5 harmonique ou excitation adaptative (E.A.). Le signal residuel est enfin 
modelisS classiquement par quelques impulsions, dont I'ensemble des 
positions est predefini dans un repertoire, appete repertoire d'excitation fixe 
(E.F) dans le bloc 33. 

10 Le decodage est, quant a lui, beaucoup moins complexe que le codage. Le 
flux binaire g6n6re par le codeur permet au decodeur, apres d£multiplexage, 
d'obtenir I'index de quantification de chaque parametre. Le decodage des 
parametres et I'application du module de synthese permettent alors de 
reconstruire le signal. 

15 

On d§crit ci-apres les trois exemples de realisation precit§s, en commengant 
tout d'abord par un codeur par transformee du type repr6sent§ sur la figure 2. 

* Premier exeinmple de reaflfisafliom) : appSicaftSomi a un codeyr "TOAC™ 

20 

Le premier exemple de realisation concerne le codeur frequence! perceptuel 
dit "TDAC" et decrit notamment dans le document publie US-2001/027393. Ce 
codeur TDAC est utilise pour coder des signaux audio numeriques 
echantillonnes a 16 kHz (bande elargie). La figure 4a illustre les blocs 

25 fonctionnels principaux de ce codeur. Un signal audio x(n) limite en bande a 7 
kHz et §chantillonne a 16 kHz est decoupe en trames de 320 echantillons (20 
ms). Une transformee en cosinus discrete modifiee (ou "MDCV) est appliquee 
(bloc fonctionnel 41) sur des trames du signal d'entree de 640 echantillons 
avec un recouvrement de 50 %, done avec un rafraTchissement de Panalyse 

30 MDCT toutes les 20 ms. On limite le spectre a 7225 Hz en mettant a zero les 
31 derniers coefficients (seuls les 289 premiers coefficients sont differents 
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de 0). Une courbe de masquage (bloc 42) est determinee a partir de ce 
spectre et tous les coefficients masques sont mis a zero. Le spectre est divise 
en 32 bandes de largeurs inegales. Les eventuelles bandes masquees sont 
determinees en fonction des coefficients transformer des signaux. Pour 
chaque bande du spectre, I'energie des coefficients MDCT est calculee (pour 
obtenir des facteurs d'echelle). Les 32 facteurs d'echelle constituent 
I'enveloppe spectrale du signal qui est ensuite quantifiee puis cotter par an 
codage entropique (bloc fonctionnel 43), et enfin transmise dans la trame 

cod£e s c - 

L'allocation dynamique des bits (bloc fonctionnel 44) se base sur une courbe 
de masquage par bande (bloc fonctionnel 42) calculee a partir de la version 
decodee et dequantifiee de I'enveloppe spectrale. Cette mesure permet d'avoir 
une compatibility entre l'allocation binaire du codeur et du decodeur. Les 
coefficients MDCT normalises dans chaque bande sont ensuite quantifies 
(bloc fonctionnel 45) par des quantificateurs vectoriels utilisant des 
dictionnaires imbriques en taille, les dictionnaires etant composes d'une union 
de codes a permutation de type II. Finalement, en se referant a la figure 4b, 
les informations sur la tonalite (codees ici sur un bit Bi) et le voisement 
(codees ici sur un bit B 0 ), ainsi que I'enveloppe spectrale e q (i) et les 
coefficients codes y q (j) sont multiplexes (bloc 46 de la figure 4a) et transmis en 
trames. 

Ce codeur pouvant fonctionner a plusieurs debits, on se propose de realiser 
un codeur multi-debits par exemple a 16, 24 et 32 kbit/s. Dans ce schema de 
codage, les blocs fonctionnels suivants peuvent etre mis en commun entre les 

differents modes: 

o Transformee MDCT (bloc 41), 

o Detection de voisement (bloc fonctionnel 47 de la figure 4a) et detection 
30 de tonalite (bloc fonctionnel 48 de la figure 4a), 
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o Calcul, quantification et codage entropique de I'enveloppe spectrale 
(bloc 43), 

o Calcul d'une courbe de masquage, coefficient par coefficient, et d'une 
courbe de masquage par bande (bloc 42). 

Ces differents blocs constituent 61,5% de la complexity du traitement dans le 
processus de codage. Lelir factorisation est done d'un interet important pour 

* 

reduire cette complexite lors de la generation de plusieurs flux binaires 
correspondants a des debits differents. 

Les resultats de ces blocs fonctionnels permettent deja d'obtenir une premiere 
partie commune a tous les flux binaires de sortie qui contient les bits 
d'information sur le voisement, la tonalite et I'enveloppe spectrale codee. 

Dans une premiere variante de cet exemple de realisation, il est possible de 
realiser les operations d'allocation des bits et de quantification pour chacun 
des flux binaires de sortie correspondant a chacun des debits binaires 
consideres. Ces deux operations sont effectuees exactement de la meme 
maniere qu'habitueliement dans un codeur TDAC. 

Dans une seconde variante plus avancee telle qu'illustree sur la figure 5, on 
peut mettre en oeuvre des techniques de transcodage "intelligent* (comme 
decrit dans le document publie US-200 1/027393 cite ci-avant) pour reduire 
davantage la complexite et mutualiser certaines operations, notamment : 

- I'allocation de bits (bloc fonctionnel 44), 

- et aussi la quantification des coefficients (blocs fonctionnels 45_i), 
comme on le verra ci-apres. 

Sur la figure 5, les blocs fonctionnels mis en partage entre les codeurs (ou 
"mutualises") portent la meme reference que ceux d'un seul codeur TDAC tel 
que represents sur la figure 4a. II s'agit des blocs 41, 42, 47, 48, 43 et 44. En 
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particulier, le bloc 44 d'allocation des bits est utilise en plusieurs passes, et le 
nombre de bits alloues est ajuste pour la transquantification qu'effectue 
chaque codeur (blocs 45 J, .... 45JK-2), 45JK-1)), comme on le verra ci- 
apres. On remarque en outre que ces transquantifications utilisent les resultats 
obtenus par le bloc fonctionnel 45_0 de quantification pour un codeur choisi, 
d'indice 0 (le codeur de debit le plus faible dans I'exemple decrit). Finalement, 
les seuls blocs fonctionnels des codeurs qui agissent sans interaction reelle - 
sont les blocs de multiplexage 46_0, 46_1,..., 46_(K-2), 46JK-1), bien qu'ils 
utilisent tous les memes informations de voisement et de tonalite, ainsi que la 
meme enveloppe spectrale codee. A ce titre, on indique simplement qu'une 
mutualisation partielle du multiplexage peut etre menee, la encore. 

Pour les deux blocs fonctionnels d'allocation de bits et de quantification, la 
strategie employee consiste a exploiter les resultats des deux blocs 
fonctionnels d'allocation des bits et de quantification realises pour le flux 
binaire (0), au debit le plus bas D 0 , pour accelerer les operations des deux 
blocs fonctionnels correspondants pour les K-1 autres flux binaire (k) 
(l<k<K). On peut aussi considerer le schema de codage multi-debits qui 
utilise un bloc fonctionnel d'allocation de bits par flux binaire (sans factorisation 
prevue pour ce bloc) mais mutualise une partie des operations de 
quantification ensuite. 

Les techniques de codage multiple presentees ci-apres se basent 
avantageusement sur un transcodage intelligent utilise pour la reduction du 
debit binaire de flux audio code, generalement situe dans un nceud du reseau. 

Dans la suite, les flux binaires k , 0 < k < K , sont classes suivant un ordre 
croissant de debits (D 0 < Di <...< D^). Ainsi, le flux binaire 0 correspond au 
d6bit binaire le plus bas. 
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* Allocation de bits 

L'allocation de bits dans le codeur TDAC se realise en deux phases. D'abord 
un premier calcul du nombre de bits a allouer a chaque bande est effectue de 
preference suivant la formule suivante : 



WJ)1 



+ C, 0<i<,M-\, 



ou c B A _ J-2« i°8 2 K (0M (0] est une constante, 

M 2M 

B est le nombre total de bits disponibles, 
M est le nombre de bandes, 

e q (,) est la valeur decodee et dequantifiee de I'enveloppe spectrale sur la 

io bande /, 

et S b (i) est le seuil de masquage pour cette bande. 

Chacune des valeurs obtenues est arrondie a rentier naturel le plus proche. Si 
le debit total alloue n'est pas exactement egal a celui disponible, une seconde 
15 phase est utilisee pour realiser le reajustement. Cette §tape se fait 
preferentiellement par une succession d'operations iteratives bas§es sur un 
critere perceptuel qui ajoute ou retire des bits aux bandes. 

Ainsi, si le nombre total de bits distribues est inferieur a celui disponible. l'a]out 
20 de bits se fait aux bandes ou I'amelioration perceptuelle est la plus importante. 
Cette amelioration perceptuelle est mesuree par la variation du rapport bruit a 
masque entre l'allocation initiate et finale des bandes. Le debit est augmente 
pour la bande oD cette variation est la plus grande. Dans le cas contraire oil le 
nombre total de bits distribues est superieur a celui disponible, I'extraction de 
25 bits sur les bandes se fait de maniere duale a cette derniere procedure. 

Dans le schema de codage multi-debits correspondant au codeur TDAC, il est 
possible de factoriser certaines operations pour l'allocation de bits. Ainsi, la 
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premiere phase de determination par la formule ci-avant peut se faire une 
seule fois en se basant sur le debit binaire D 0 le plus bas. La phase de re- 
ajustement en ajoutant des bits peut se faire ensuite de maniere continue. Une 
fois que le nombre total de bit distribue attaint le nombre correspondant a un 
5 debit binaire d'un flux binaire k, k=1,2...,K-1, la distribution courante est 
consideree comme celle qui est utilisee pour la quantification des vecteurs de 
coefficients normalises par bande de ce flux binaire. 

* Quantification des coefficients 

o Pour ce qui concerne la quantification des coefficients, le codeur TDAC utilise 
une quantification vectorielle utilisant des dictionnaires imbriques en taille, les 
dictionnaires etant composes d'une union de codes a permutation de type II. 
Ce type de quantification s'applique sur chacun des vecteurs des coefficients 
MDCT sur une bande. Un tel vecteur est normalise au prealable en utilisant la 

15 valeur dequantif.ee de I'enveloppe spectrale sur cette bande. On note : 

- C(&„4) le dictionnaire correspondant au nombre de bits b t et a la dimension 

d,, 

- N{b t ,d,) le nombre d'elements dans ce dictionnaire, 

- CLfayd,) I'ensemble de ses leaders, et 
20 - NL(b,,d,) le nombre de leaders. 

Le resultat de quantification pour chaque bande i de la trame est un mot de 
code m t transmis dans le flux binaire. II represente I'index du vecteur quantifie 
dans le dictionnaire et calcule a partir des informations suivantes : 
25 o le numero L n dans I'ensemble CZM.) des leaders du dictionnaire 

CM,), du vecteur leader quantifie Y q (i) plus proche voisin d'un 

leader cou rant Y(i), 
o le rang r t de Y q (i) dans la classe du leader Y q (i) , 
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• et la combinaison de signes sign q (i) & appliquer a Y q (i) (ou a Y q (i)) 9 

0C1 Ton precise les notations suivantes : 

• Y(i) est le vecteur des valeurs absolues des coefficients normalises 

de la bande i, 

• signQ) est le vecteur des signes des coefficients normalises de la 
bande i, 

• Y(i) est le vecteur leader du vecteur Y(i) pr6cit6, obtenu par 
ordonnancement decroissant de ses composantes (la permutation 
correspondante est notee perm{i)), 

• et Y q (/) est le vecteur quantifie de Y(i) (ou "/e plus proche voisin" de 
F(z) dans le dictionnaire C(6„ </,)). 

Dans la suite, la notation avec un exposant k, indique le parametre 
utilise dans le traitement effectue pour obtenir le flux binaire du codeur k. Les 
parametres sans cet exposant etant calcules une seule fois pour toutes pour le 
flux binaire 0. lis sont independants du debit (ou du mode) consider^. 

La propriety "d'imbrication" des dictionnaires precitee s'exprime selon la 
relation : 

avec aussi : 

Cife 0) ,^)c ... C CL(tii k - x \d)c: CL{b?\d)...ci CL(b\ K ~ x \d) 

On note ClAp\ k \d) \CL{p\ h ' x \d) le complementaire de CLipl k ~ x \d) dans 
CL(p\ k \d). Son cardinal est egal a NLty k \d)-NL{b\ k ~ x \d). 
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L'obtention des mots de code mj k) (avec 0<k<K) t resultats de la 

quantification du vecteur des coefficients de la bande i pour chacun des flux 
binaires k, se fait comme suit 

• Pour le flux binaire k = 0 t reparation de quantification se fait de manfere 
classique comme habituellement dans le codeur TDAC. Elle permet 

d'obteniMes param^tres, rfgw 9 <0) (0. et r / (0) °1 ui permettent.de 

construire le mot de code m} 0) . On determine d'ailleurs dans cette 

m§me 6tape les vecteurs f (*) et sign(i) . lis sont stockes en memoire, 
ainsi que la permutation correspondante perm(i) , pour etre utilises, le 
cas echeant, dans les 6tapes suivantes relatives aux autres flux 
binaires. 

• Pour les flux binaires 1 <. k < K , on precede de maniere incrementale, 
de k = l jusqu'a k = K-1, en utilisant preferentiellement les etapes 
suivantes : 

Sl^-J/H) alors: 

1 . le mot de code, sur la bande i, de la trame du flux binaire k est le 
meme que celui de la trame du flux binaire (k - 1) : 

et = m\ k - l) 

Sinon.i.e. (bj k) > b\ k ~ l) ) : 

2. On recherche parmi les (NL(b} k) ,d,)-NL(bf k - l \d,)) leaders de 

CL(b} k \d,) \CL(bj k - l \d t ) le plus proche voisin de f(i), 

3. Avec fe resultat de I'etape 2 et connaissant le plus proche voisin 
de Y (/) dans CL(bl k ~ l) ,d,), on teste si le plus proche voisin de 

f(/) dans CL(bf k \d,) est dans CL^Kd,) (cas "Flag=0" ci- 

apres) ou CL^ k \d) \Cz(#*"V,) (cas "Flag=1" ci-apres), 
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4. Si Flag=0 ((le leader le plus proche de Y (/) dans CZ,(#*~V,) est 
aussi son plus proche voisin dans Clftf\d,)) alors : 

Si Flag=1 (le leader le plus proche de Y(i) dans 
CL{p\ k) ,d)\CL^ k - X) ,d) trouve a I'etape 2 est aussi son plus 
proche voisin dans d{bf\d)), soit if* son numero (avec 
4 k) ^ Nlip\ k ~ X) ,<*,)), alors on effectue les etapes ci-apres : 

a. Recherche du rang de rf (/) (nouveau vecteur quantifie 
de 7(0 dans la classe du leader ?, w (0) P ar exemple par 
I'algorithme de Schalkwijk en utilisant permif) , 

b. Determination de signf (/) en utilisant sign(i) et perm(i), 

c. Determination du mot de code a partir de L (k) , et 

* Deuxieme exemple de realisation : application a un codeyr pair 

to-ansfforimee de type RflPEG-1 Layer l&ll 
Le codeur MPEG-1 Layer l&ll, presente a la figure 6a, utilise un banc de filtres 
a 32 sous-bandes uniformes (bloc 61 de la figure 6a) pour realiser la 
transformation temps/frequence du signal audio d'entree s 0 . Les echantillons 
de sortie de chaque sous-bande sont regroupes, puis normalises par un 
facteur d'echelle commun (determine par le bloc fonctionnel 67) avant d'etre 
quantifies (bloc 62). Le nombre de niveaux du quantificateur scalaire uniforme 
utilise pour chaque sous-bande resulte d'une procedure d'allocation 
dynamique des bits (realisee par le bloc 63). Cette procedure utilise un modele 
psychoacoustique (bloc 64) pour determiner la repartition des bits qui rend le 
bruit de quantification le moins perceptible possible. Les modeles d'audition 
proposes dans la norme se basent sur I'estimation du spectre obtenu par une 
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transforms de Fourier rapide (FFT) du signal tempore! d'entree (realisee par 
le bloc 65). En se referant a la figure 6b, la trame s Cl multiplexee par le bloc 66 
de la figure 6a et qui est finalement transmise, contient, apres un champ 
d'entete H D , I'ensemble des echantillons des sous-bandes quantifies E S b, qui 
represented Information principale, et une information complementaire 
utilisee pour reoperation de decodage constitute par les facteurs d'echelle F E et 
Pallocation de bits Ai. 

A partir de ce schema de codage, la construction d'un codeur multi-debits, 
dans une application de I'invention, peut etre realisee en mettant en commun 
les blocs fonctionnels suivants, en se referant a la figure 7 : 

• Banc de filtres d'analyse 61 

• Determination des facteurs d'echelle 67 

• Calcul 65 de la transformee de Fourier FFT 

• Determination des seuils de masquage suivant un modele 
psychoacoustique 64. 

Les deux blocs 64 et 65 fournissent deja les rapports signal a masque (fleches 
SMR des figures 6a et 7), utilises pour la procedure d'allocation de bits (bloc 
70 de la figure 7). 

Dans cet exemple de realisation tel que represents sur la figure 7, il est 
possible de tirer profit de la procedure utilisee pour ^allocation de bits pour la 
mettre aussi en commun, mais en ajoutant toutefois quelques modifications a 
relocation (bloc 70 d'allocation des bits de la figure 7). Seul le bloc fonctionnel 
de quantification 62_0 a 62_(K-1) est done specifique a chaque flux binaire 
correspondant a un debit D k , 0^k<K-l. II en va de meme pour le bloc de 
multiplexage 66_0 a 66_(K-1). 
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* Allocation des bits 

Dans le codeur MPEG-1 Layer l&H, I'allocation se fait preferentiellement par 
une succession d'etapes iteratives comme suit. 

Efape 0 : Initialisation a zero du nombres de bits b, de chacune des sous- 
bandes i, 0 ^ i < M . 

Etape 1 : Mise a jour de la fonction de distorsion NMR'i) (appelee "rapport 
bruit a masque", de I'anglais "Noise to Mask Ratio") sur chacune des sous- 
bandes : 

NMR(i) = SMR(i)-SNR(b,) % 

oil SNR{b,) est le rapport signal a bruit correspondant au quantificateur ayant 
un nombre de bits b, , 

et SMR(i) le rapport signal a masque fourni par le modele psychoacoustique. 

Etape 2 : Incrementation du nombre de bits b k de la sous-bande / 0 od cette 
distorsion est maximale: 

od s est une valeur entiere positive dependant de la bande, en general prise 
egale a 1 . 

Les etapes 1 et 2 sont repetees de maniere iterative jusqu'a ce que le nombre 
total de bits disponibles, correspondant au debit de fonctionnement, soit 
distribue. Le resultat est alors un vecteur de distribution de bits (b 0 ,b^..,b u ^) . 

Dans le schema de codage multi-debits, ces etapes sont mises en commun 
> avec quelques autres modifications, notamment : 

• le bloc fonctionnel ayant pour sortie K vecteurs de distributions de bits 

(bi k) M k) ,.. . t b£l) (avec 0<k<K-l), un vecteur (# ) ,6f* ) ,... 9 tf-i) est 

obtenu lorsque le nombre total de bits disponibles correspondant au 
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debit binaire D k du flux binaire k est dlstribue, a I'iteration des etapes 1 
et.2. 

o L'arret de I'iteration des etapes 1 et 2 se fait lorsque le nombre total de 
bits disponibles correspondant au debit binaire le plus eleve D K _ X est 
5 totalement distribue (on rappelle que les flux binaires sont ordonnes 

suivant un ordre croissant de debits). 

On notera que les vecteurs de distribution debits sont obtenus 
successivement a partir de k-0 jusqu'a * = *-!. Les K sorties de ce bloc 
10 deallocation de bits alimentent alors les blocs de quantification pour chacun des 
i flux binaires au debit donne. 

i 

* Troisieme exemple de realisation : application a un codeur de type 

i 

i CELP 

15 Le dernier exemple de realisation concerne le codage de la parole mult- 
modes a decision a posteriori a partir du codeur 3GPP NB-AMR (pour 
"Narrow-Band Adaptive Multi-Rate") qui est un codeur de parole en bande 
telephonique multi-debits adaptatif, selon une norme 3GPP. Ce codeur qui 
appartient a la famille bien connue des codeurs CELP dont le principe a ete 
20 decrit brievement plus haut, comporte huit modes (ou debits) allant de 12,2 
kbit/s a 4,75 kbit/s, tous bases sur la technique ACELP (pour "Algebraic Code 
Excited Linear Prediction"). La figure 8 donne le schema de codage en blocs 
fonctionnels de ce codeur. Cette structure a ete exploitee afin de realiser un 
codeur multi-modes a decision a posteriori, base sur 4 modes du codeur NB- 
25 AMR (7,4; 6,7; 5,9; 5,15). 

Dans une premiere variante, seule la mutualisation des blocs fonctionnels 
identiques est exploitee (les resultats des quatre codages sont alors ident,ques 
a ceux des quatre codages en parallele). 
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Dans une deuxieme variante, la complexity est encore plus reduite. Les 
calculs de blocs fonctionnels non identiques pour certains modes sont 
acceleres en exploitant ceux d'un autre mode ou d'un module de traitement 
commun, comme on le verra ci-apres. Les resultats des quatre codages ainsi 
mutualises sont alors differents de ceux des quatre codages en parallele. 

Dans une autre variante encore, les blocs fonctionnels de ces quatre modes 
sont utilises pour un codage multi-modes en treillis, comme on I'a vu ci-avant 
en reference a la figure 1d. 

On rappelle brievement ci-apres les quatre modes (7,4; 6,7; 5,9; 5,15) du 
codeur 3GPP NB-AMR. 

Le codeur 3GPP NB-AMR travaille sur un signal de parole limite en bande a 
3,4 kHz et echantillonne a 8 kHz decoupe en trames de 20 ms (160 
echantillons). Chaque trame comporte 4 sous-trames de 5 ms (40 
echantillons) regroupees 2 par 2 dans des "super sous-trames" de 10 ms (80 
echantillons). Pour tous les modes, les memes types de parametres sont 
extraits du signal mais avec des variantes de moderation et/ou de 
quantification de ces parametres. Dans le codeur NB-AMR, cinq types de 
parametres sont a analyser et a coder. Les parametres LSP (pour "Line 
Spectral Pairs") sont traites une fois par trame pour tous les modes, sauf pour 
le mode 12,2 (done une fois par super sous-trame). Les autres parametres 
(notamment le retard LTP, le gain de I'excitation adaptative, I'excitation fixe, le 
gain de I'excitation fixe) sont traites une fois par sous-trame. 

Les quatre modes considers ici (7,4; 6,7; 5,9; 5,15) se distinguent 
essentiellement par les quantifications de leurs parametres. L'allocation binaire 
de ces 4 modes est resumee dans le tableau 1 ci-apres. 
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Mode (kbit/s) 


7,4 


6,7 


5,9 


5,15 


LSP 


26^(8+9+9) 


26=(8+9+9) 


26=(8+9+9) 


23={8+8+7) 


Retards LTP 


8 / 5 / 
8/5 


8 / 4 / 
8 /4 


8 / 4 / 
8/4 


8 / 4 / 
4/4 


Excitation fixe 


17/17/ 
17/17 


14/14/ 
14/14 


11/11/ 
11/11 


9 / 9 / 
9/9 


Gains des 
excitations 'fixe 
et adaptative 


7/7/ 
7/7 


7- / 7 / 
7/7 


6 / 6 / 
6/6 


6 / 6 / • 
6/6 


Total par trame 


148 


134 


118 


103 



Tableau 1; Allocation binaire des 4 modes 
(7,4; 6,7; 5,9; 5,15) du codeur 3GPP NB-AMR 



Ces 4 modes du codeur NB-AMR (7,4; 6,7; 5,9; 5,15) possedent des modules 
5 identiques comme par exemple le pre-traitement, Panalyse des coefficients de 
prediction lineaire, le calcul de signal ponder6. Le pre-traitement du signal est 
un filtrage passe-haut de frequence de coupure 80 Hz pour supprimer les 
composantes continues combine a une division par deux des signaux d'entree 
pour eviter des debordements. L'analyse LPC comprend des sous-modules de 
10 fenetrage, de calcul des autocorrelations, de mise en oeuvre de Talgorithme de 
Levinson-Durbin, de transformation A(z)-»LSP, de calcul des parametres LSPi 
non quantifies pour chaque sous-trame (i=0,.. M 3) par interpolation entre les 
LSP de la trame passee et ceux de la trame courante, et de transformation 
inverse (LSPi-> Ai(z)). 

15 

Le calcul du signal de parole pondere reside en un filtrage par le filtre de 
ponderation perceptuelle (Wi(z)=Ai(z/yi)/Ai(z/y 2 ) ou Ai(z) est le filtre non 
quantifie de la sous-trame d'indice i avecyi -0,94 et 72=0,6), 

20 D'autres blocs fonctionnels ne sont identiques que pour trois de ces modes 
(7,4; 6,7; 5,9). Par exemple, la recherche du retard LTP en boucle ouverte 
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effective sur le signal pondere une fois par super sous-trame pour ces trois 
modes. Pour le mode a 5,15, elle n'est effectuee en revanche qu'une fois par 
trame. 



5 De meme, si les quatre modes utilisent une quantification vectorielle ponderee 
predictive MA (pour "Moving Average") d'ordre 1 a moyenne supprimee et par 
produit cartesien des parametres LSP dans ie domaine frequentiel normalise, 
la quantification des parametres LSP du mode a 5,15 kbit/s se fait sur 23 bits, 
celle des trois autres modes sur 26 bits. Apres transformation dans le domaine 

10 frequentiel normalise, la quantification vectorielle par produit cartesien (dite 
"split VQ") des parametres LSP scinde les 10 parametres LSP en 3 sous- 
vecteurs, de dimension 3, 3 et 4. Le premier sous-vecteur compose des 3 
premiers LSP est quantifie sur 8 bits par le meme dictionnaire pour les quatre 
modes. Le deuxieme sous-vecteur compose des 3 LSP suivants est quantifie 

15 pour les 3 modes haut debit par un dictionnaire de taille 512 (9 bits) et pour le 
mode a 5,15 par la moitie de ce dictionnaire (un vecteur sur 2). Le troisieme et 
dernier sous-vecteur compose des 4 derniers LSP est quantifie pour les 3 
modes haut debit par un dictionnaire de taille 512 (9 bits) et pour le mode de 
plus faible debit par un dictionnaire de taille 128 (7 bits). La transformation 

20 dans le domaine frequentiel normalise, le calcul des poids du critere d'erreur 
quadratique et la prediction MA (pour "Moving Average") du residu LSP a 
quantifier sont identiques pour les 4 modes. Les trois modes haut debit 
utilisant les meme dictionnaires pour quantifier les LSP, ils peuvent partager, 
en plus du meme module de quantification vectorielle, la transformation 

25 inverse (pour revenir du domaine frequentiel normalise vers le domaine en 
cosinus), ainsi que le calcul des LSP Q i quantifies pour chaque sous-trame 

(i=0 3) par interpolation entre les LSP quantifies de la trame passee et ceux 

de la trame courante, et enfin la transformation inverse LSP Q j -» A Q i(z). 
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Les recherches en boucle fermee des excitations adaptative et fixe sont faites 
sequentiellement et n6cessitent au prealable le calcul de la r6ponse 
impulsionnelle du filtre de synthase ponder§, puis de signaux-cible. La 
reponse impulsionnelle du filtre de synthase pond6re (Ai(z/Vi)/[A Q i(z)Ai(z/^)]) 

5 est identique pour les 3 modes haut debit (7,4; 6,7; 5,9). Pour chaque sous- 
trame, le calcul du signal-cible pour Texcitation adaptative depend du signal 
pond6re (independamm^nt du mode); du filtre quantifie A Q j(z) (identique pour 
3 des modes) et du passe de la sous-trame (diff6rent pour chaque sous-trame 
autre que la premiere sous-trame). Pour chaque sous-trame, le signal-cible 

io pour Texcitation fixe est obtenu en retirant au signal-cible precedent la 
contribution de Pexcitation adaptative filtree de cette sous-trame (qui est 
' differente d'un mode a I'autre sauf pour la premiere sous-trame des 3 premiers 
modes). 

15 Trois dictionnaires adaptatifs sont utilises. Le premier dictionnaire, pour les 
sous-trames paires (i=0 et 2) des modes (7,4; 6,7; 5,9) et pour la premiere 
sous-trame du mode a 5,15, comporte 256 retards absolus fractionnaires, de 
resolution 1/3 dans Pintervalle [19 + 1/3,84 + 2/3] et de resolution entiere dans 
Tintervalle [85,143]. La recherche dans ce dictionnaire de retards absolus est 

20 focalisee autour du retard trouve en boucle ouverte (intervalle de ±5 pour le 
mode a 5,15, de ±3 pour les autres modes). Pour la premiere sous-trame des 
modes (7,4; 6,7; 5,9), le signal-cible et le retard en boucle ouverte etant 
identique, le resultat de cette recherche en boucle fermee Test aussi. Les deux 
autres dictionnaires sont de type differentiel et permettent de coder la 

25 diff§rence entre le retard courant et le retard entier Tm le plus proche du retard 
fractionnaire de la sous-trame precedente. Le premier dictionnaire differentiel 
sur 5 bits, utilise pour les sous-trames impaires du mode a 7,4, est de 
resolution 1/3 autour du retard entier Tm dans Tintervalle [Tm-S +2/3, Tm+4 
+2/3]. Le deuxieme dictionnaire differentiel sur 4 bits, inclus dans le premier, 

30 est utilise pour les sous-trames impaires des modes a 6,7 et 5,9 ainsi que pour 
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les trois dernieres sous-trames du mode a 5,15. Ce deuxieme dictionnaire est 
de resolution entiere autour du retard entier T M dans I'intervalle [Tn-5, Tn+4] 
plus une resolution de 1/3 dans I'intervalle [Tn-1 + 2/3, T M + 2/3]. 

Les dictionnaires fixes appartiennent a la famille bien connue des dictionnaires 
ACELP. La structure d'un repertoire ACELP est basee sur le concept ISPP 
(pour "Interleaved Single-Pulse Permutation") qui consiste a diviser Tensemble 
des L positions en K pistes entrelacees, chacune des N impulsions etant 
localisee dans certaines pistes predefinies. Les 4 modes (7,4; 6,7; 5,9; 5,15) 
utilisent la meme decoupe des 40 echantillons d'une sous-trame en 5 pistes de 
longueur 8 entrelacees, comme le montre le tableau 2a. Le tableau 2b montre, 
quant a lui, pour les 3 modes (7,4; 6,7; 5,9) le debit du dictionnaire, le nombre 
d'impulsions et leur repartition dans les pistes. La repartition des 2 impulsions 
du dictionnaire ACELP a 9 bits du mode a 5,15 est encore plus contrainte. 




• Decoupe en pistes entrelacees des 40 positions 
d'une sous-trame du codeur 3GPP NB-AMR 
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Mode (kbit/s) 


7,4 


6,7 


5,9 


D&bit du dictionnaire 

ACELP 

(positions+amplitudes ) 

1 ^ mm 


17 
(13+4) 


14 
(11+3) 


11 

(9+2) 


Nombre d' impulsions 


4 


3 


2 


Pistes potentielles pour 

±0 


Po 


Po 


Pi/ P3 


Pistes potentielles pour 

ii 


Pi 


Plf P3 


Po, Pi, 

P2, P4 


Pistes potentielles pour 

i2 


P2 


P2, P4 




Pistes potentielles pour 

13 


P3, P4 







Tableau 2b: Repartition des impulsions dans les pistes 
pour les modes 7,4; 6,7; 5,9 du codeur 3GPP NB-AMR 

Les gains des excitations adaptative et fixe sont quantifies sur 7 ou 6 bits 
(avec une prediction MA appliquee au gain de I'excitation fixe) par une 
quantification vectorielle conjointe minimisant le critere CELP. 

* Codage multi-modes a decision a posteriori n'exploitant que la mutualisation 
des blocs fonctionnels identiques 

A partir de ce schema de codage, la construction d'un codeur multi-modes a 
decision a posteriori peut etre realisee en mettant en commun les blocs 
fonctionnels suivants. 

En se referant a la figure 8, pour les 4 modes, on effectue en commun : 

• le pre-traitement (bloc 8 1 ) , 

• I'analyse des coefficients de prediction lineaire (fenetrage et calcul des 
autocorrelations 82, mise en ceuvre de I'algorithme de Levinson-Durbin 
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83, transformation A(z)-»LSP 84, interpolation des LSP et 
transformation inverse 862), 

o le calcul du signal d'entr§e pond6r6 87, 

o la transformation des param6tres LSP dans le domaine frequentiel 
5 normalise, le calcul des poids du critere d ! erreur quadratique pour la 

quantification vectorielle des LSP, la prediction MA du residu LSP, la 
quantification vectorielle des 3 premiers LSP (dans le bloc 85). 

Pour tous ces blocs, leur complexity cumutee est ainsi divisSe par 4. 
Pour les 3 modes de plus haut debit (7,4; 6,7; 5,9), on effectue : 
io o la quantification vectorielle des 7 derniers LSP (une fois par trame) 

(dans le bloc 85 de la figure 8), 

o la recherche du retard LTP en boucle ouverte (2 fois par trame) (bloc 
88), 

o Interpolation des LSP quantifies (861) et la transformation inverse vers 
15 les filtres A Q j (pour chaque sous-trame), 

o le calcul de la reponse impulsionnelle 89 du filtre de synthese pondere 
(pour chaque sous-trame). 

Pour ces blocs, les calculs ne sont plus effectues 4 fois mais 2 fois, une fois 
pour les 3 modes a plus haut debit et une fois pour le mode a faible debit. Leur 
20 complexity est done divisee par 2. 



On peut aussi, pour ces 3 modes de plus haut debit, mutualiser pour la 
premiere sous-trame le calcul des signaux-cible pour Texcitation fixe (bloc 91 
sur la figure 8) et adaptative (bloc 90), ainsi que la recherche LTP en boucle 
25 fermee (bloc 881). II faut noter que la mutualisation de ces operations pour la 
premiere sous-trame ne produit des resultats identiques que dans le contexte 
du codage multiple de type multi-modes a decision 3 posteriori. Dans le 
contexte general de codage multiple, le pass6 de la premiere sous-trame est, 
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comme pour les 3 autres sous-trames, different selon les debits, ces 
operations conduisent generalement alors a des resultats differents. 

* Codage multi-modes a decision a posteriori avancGe 

Des blocs fonctionnels non identiques peuvent etre acceleres en exploitant 
ceux d'un autre mode ou d'un module de traitement commun. Selon les 
contraintes de I'application (en termes de qualite et/ou de complexite); on peut 
utiliser differentes variantes. Quelques exemples sont decrits ci-apres. II est 
aussi possible de s'appuyer sur des techniques de transcodage intelligent 
entre codeurs CELP. 

* La quantification vectorielle du deuxieme sous-vecteur de LSP 

On peut, comme dans le cas du mode de realisation pour le codeur TDAC, 
exploiter I'imbrication de certains dictionnaires pour accelerer les calculs. Ainsi, 
le dictionnaire du deuxieme sous-vecteur de LSP du mode a 5,15 etant inclus 
dans celui des 3 autres modes, la quantification de ce sous-vecteur Y par les 4 
modes peut etre ainsi avantageusement combinee: 

o Etape 1: Chercher son plus proche voisin Y| dans le plus petit 
dictionnaire (correspondant a la moitie du grand dictionnaire) 

o Yi quantifie Y pour le mode a 5, 1 5 
o Etape 2: Chercher le plus proche voisin Yh dans le complementaire 
dans le grand dictionnaire (soit I'autre moitie du dictionnaire) 

o Etape 3: Tester si le plus proche voisin de Y dans le dictionnaire a 9 bits 
est Yi (cas "Flag=0") ou Y h (cas "Flagyl") 

o cas "Flag=0" : Yi quantifie aussi Y pour les modes a 7,4; 6,7 et 
5,9 

o sinon (cas "Flagyl"), Y h quantifie Y pour les modes a 7,4; 6,7 et 
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Cette mise en ceuvre donne un resultat identique a celui du codage multi- 
mode non optimise. Si Ton desire reduire davantage la complexity de la 
quantification, on peut s'arreter a I'etape 1 et prendre Y t comme vecteur 
quantifie pour les modes haut debit si ce vecteur est juge suffisamment proche 
de Y. Cette simplification peut done donner un resultat different d'une 
recherche exhaustive. 

* Acceleration de la recherche LTP en boucle ouverte 

La recherche du retard LTP en boucle ouverte du mode a 5,15 peut exploiter 
les resultats de celle des autres modes. Si les deux retards en boucle ouverte 
trouves sur les 2 super sous-trames sont suffisamment proches pour permettre 
un codage differentiel, la recherche en boucle ouverte du mode a 5,15 n'est 
pas effectuee. On utilise plutot les resultats des modes superieurs. Sinon, on 
peut : 

- effectuer la recherche classique, 

- ou focaliser la recherche en boucle ouverte sur toute la trame autour des 
deux retards en boucle ouverte trouves par les modes superieurs. 

A I'inverse, on peut aussi effectuer d'abord la recherche du retard en boucle 
ouverte sur le mode a 5,15 et focaliser les deux recherches du retard en 
boucle ouverte des modes superieurs autour de la valeur determinee par le 
mode a 5,15. 

Dans une troisieme variante plus avancee, illustree a la figure 1d, on se 
propose de realiser un codeur multi-modes en treillis permettant plusieurs 
combinaisons de blocs fonctionnels, chaque bloc fonctionnel possedant au 
moins deux modes de fonctionnement (ou debits). On construit ce nouveau 
codeur a partir des quatre debits du codeur NB-AMR cites ci-avant (5,15; 5,90; 
6,70; 7,40). Dans ce codeur, on distingue quatre blocs fonctionnels: le bloc 
LPC, le bloc LTP, le bloc excitation fixe et le bloc de gains. En se referant au 
tableau 1 presente ci-avant, le tableau 3a ci-apres recapitule pour chacun de 
ces blocs fonctionnels, son nombre de debits et ses debits. 
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Bloc fonctionnel 


Nombre de debits 


Debits des blocs 
fonctionnel s 


LPC (LSP) 


2 


26 et 23 


Retard LTP 


3 


26, 24 et 20 


Excitation fixe • 


. 4 


68, 56, -44 et- 36 


Gains 


2 


28 et 24 



Tableau 3a: Nombre de debits et debits des blocs 
fonctionnels pour les quatre modes (5,15; 5,90; 6,70; 
5 7,40) du codeur NB-AMR. 



On a done P=4 blocs fonctionnels et 2x3x4x2 = 48 combinaisons 
possibles. Dans I'exemple particulier de realisation, on choisit de ne pas 
considSrer le haut-debit du bloc fonctionnel 2 (LTP debit 26 bits/trame). Un 
10 autre choix est possible, bien entendu. 



Le codeur multi-debits ainsi obtenu possede une grande granularite en debits, 
avec 32 modes possibles donnas dans le tableau 3b. Toutefois, on indique 
que le codeur ainsi obtenu n'est pas interoperable avec le codeur NB-AMR 
15 precite. Dans le tableau 3b, les modes correspondents aux trois debits du NB- 
AMR (5,15; 5,90; 6,70) sont presentes en gras, I'exclusion du debit le plus 
eleve du bloc fonctionnel LTP eliminant le debit de 7,40. 
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26 



26 



26 



26 



26 



24 



24 



24 



24 



24 



44 



56 



56 



68 



68 



28 



24 



28 



24 



28 



122 



130 



134 



142 



14 6 



3b: Debit par bloc fonctionnel et global du codeur 

multi-modes en treillis 



Ce codeur possedant 32 debits possibles, 5 bits sont necessaires pour 
identifier le mode utilise. Comme dans la variante precedente, la mutualisation 
de blocs fonctionnels est exploitee. On applique des strategies de codage 
differentes pour les differents blocs fonctionnels. 

Par exemple, pour le bloc fonctionnel 1 comprenant la quantification des LSP, 
on privilegie le bas debit comme mentionne ci-avant de la maniere suivante : 

- Le premier sous-vecteur compose des 3 premiers LSP est quantifie sur 8 bits 
par le m§me dictionnaire pour les deux debits associes a ce bloc fonctionnel, 

- Le deuxieme sous-vecteur compose des 3 LSP suivants est quantifie sur 8 
bits par le dictionnaire du plus petit debit. Ce dictionnaire correspondant a la 
moitie du dictionnaire de plus haut debit, on n'effectue la recherche dans 
I'autre moitie du dictionnaire que si la distance entre les 3 LSP et I'element 
choisi dans le dictionnaire depasse un certain seuil. 

- Le troisieme et dernier sous-vecteur compose des 4 derniers LSP est 
quantifie par un dictionnaire de taille 512 (9 bits) et par un dictionnaire de taille 
128 (7 bits). 

Par contre, comme mentionne ci-avant dans la deuxieme variante 
(correspondant au codage multi-modes a decision a posteriori avancee), on 
choisit de privilegier le haut-debit pour le bloc fonctionnel 2 (retard LTP). Dans 
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le codeur NB-AMR, la recherche du retard LTP en boucle ouverte est 
effectuee deux fois par trame pour le retard LTP de 24 bits et elle est effectuee 
une seule fois par trame pour celui de 20 bits. Pour ce bloc fonctionnel, on 
souhaite favoriser le haut debit. Done, le calcul du retard LTP en boucle 
ouverte est realise de la maniere suivante: 

- On calcule deux retards en boucle ouverte sur les 2 super sous-trames. S'ils 
sont suffisamment proches pour permettre un codage differentiel; la recherche 
en boucle ouverte sur la trame entiere n'est pas effectuee. On utilise plut6t les 
resultats des deux super sous-trames. 

- Sinon, on effectue une recherche en boucle ouverte sur toute la trame en la 
focalisant autour des deux retards en boucle ouverte trouves precedemment. 
Une variante reduisant la complexite retient uniquement le retard en boucle 
ouverte de la premiere. 

Apres certains blocs fonctionnels, il est possible de realiser une selection 
partielle permettant de reduire le nombre de combinaisons a explorer. Par 
exemple, apres le bloc fonctionnel 1 (LPC), on peut eliminer les combinaisons 
avec 26 bits pour ce bloc si la performance du debit de 23 bits est 
suffisamment proche ou inversement eliminer le mode a 23 bits si sa 
performance est trop degradee par rapport au mode a 26 bits. 

Ainsi, la presente invention permet de fournir une solution efficace au 
probleme de la complexite des codages multiples, par la mutualisation et 
I'acceleration des calculs mis en oeuvre par les differents codeurs. Les 
structures de codage peuvent done etre representees a I'aide de blocs 
fonctionnels decrivant les differentes operations effectuees au cours d'un 
traitement. Les blocs fonctionnels des differents codages mis en ceuvre dans 
un codage multiple possedent des relations fortes qui sont exploitees au sens 
de la presente invention. Ces relations sont particulierement fortes lorsque les 
differents codages correspondent a differents modes d'une meme structure. 
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On indique enfin que la presente invention est flexible du point de vue de la 
complexity II est possible en effet de decider a priori la complexity maximum 
du codage multiple et d'adapter le nombre de codeurs explores en fonction de 
cette complexity. 
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10 



15 



25 



30 



Revendjcatjons 

1. Procede de codage multiple en compression, dans lequel un signal d'entree 
est destine a alimenter en parallele une pluralite de codeurs comportant 
chacun une succession de blocs fonctionnels, en vue d'un codage en 
compression dudit signal par chaque codeur, 

caracteris6 en ce qu'il comporte les etapes preparatoires ci-apres : 

a) identifier les blocs fonctionnels formant chaque codeur, ainsi qu'une ou 
plusieurs fonctions realisees par chaque bloc, 

b) reperer, parmi lesdites fonctions, des fonctions qui sont communes d'un 
codeur & I'autre, et 

c) executer lesdites fonctions communes, une fois pour toutes, pour une partie 
au moins de tous les codeurs, au sein d'au moins un meme module de calcul. 

2. Procede selon la revendication 1 , caracterise en ce que ledit module de 
calcul est constitue par un ou plusieurs blocs de I'un des codeurs. 



3. Proc6de selon la revendication 2, caracterise en ce que, pour chaque 
fonction executee a I'etape c), on utilise au moins un bloc fonctionnel d'un 
20 codeur choisi parmi ladite pluralite de codeurs, 

et en ce que le bloc dudit codeur choisi est agence pour delivrer des resultats 
partiels aux autres codeurs, pour un codage efficace, aupres desdits autres 
codeurs, verifiant un critere optimal entre la complexite et la qualite du codage. 



4. Procede selon la revendication 3, dans lequel les codeurs sont susceptibles 
d'operer a des debits respectifs differents, caracterise en ce que le codeur 
choisi est le codeur de debit le plus faible, et en ce que les resultats obtenus, 
suite a I'execution de la fonction a I'etape c) avec des parametres propres au 
codeur choisi, sont adaptes aux debits d'une partie au moins des autres 
codeurs par une recherche focalisee de parametres pour une partie au moins 
de tous les autres modes, jusqu'au codeur de debit le plus eleve. 
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5. Procede selon la revendication 3, dans lequel les codeurs sont susceptibles 
d'operer a des debits respectifs differents, caracterise en ce que le codeur 
choisi est le codeur de debit le plus eleve, et en ce que les resultats obtenus, 
suite a I'execution de la fonction a I'etape c) avec des parametres propres au 
codeur choisi, sont adaptes aux debits d'une partie au moins des autres 
codeurs par une recherche focalisee de parametres pour une partie au moins 
de tous les autres modes, jusqu'au codeur de debit le plus faible. 

6. Procede selon la revendication 4, prise en combinaison avec la 
revendication 5, caracterise en ce que, pour un debit donne, on utilise le bloc 
fonctionnel d'un codeur operant audit debit donne, en tant que module de 

-calcul, et on adapte progressivement au moins une partie des parametres 
propres a ce codeur : 

- jusqu'au codeur de debit le plus eleve, par recherche focalisee, et 

- jusqu'au codeur de debit le plus faible, par recherche focalisee. 

7. Procede selon la revendication 1, dans lequel les blocs fonctionnels des 
differents codeurs sont agences en treillis, avec plusieurs chemins possibles 
dans le treillis, caracterise en ce que chaque chemin du treillis est defini par 
une combinaison de modes de fonctionnement des blocs fonctionnels, chaque 
bloc fonctionnel alimentant plusieurs variantes possibles du bloc fonctionnel 
suivant. 

8. Procede selon la revendication 7, caracterisee en ce que Ton prevoit un 
module de selection partielle, apres chaque etape de codage menee par un ou 
plusieurs blocs fonctionnels, capable de selectionner les resultats fournis par 
un ou plusieurs de ces blocs fonctionnels, pour des etapes suivantes de 
codage. 
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9. Procede selon la revendication 7, dans lequel les blocs fonctionnels sont 
susceptibles d'operer a des debits respectifs differents et en utilisant des 
parametres respectifs propres auxdits debits, 

caracteris6 en ce que, pour un bloc fonctionnel donne, le chemin du treillis 
choisi est celui traversal le bloc fonctionnel de debit le plus faible, 
et en ce que les resultats obtenus dudit bloc fonctionnel de debit le plus faible 
sontadaptes aux debits d'une partie au moins des autres blocs fonctionnels- 
par une recherche focaiisee de parametres pour une partie au moins de tous 
les autres blocs fonctionnels, jusqu'au bloc fonctionnel de debit le plus eleve. 

10. Precede selon la revendication 7, dans lequel les blocs fonctionnels sont 
susceptibles d'operer a des debits respectifs differents et en utilisant des 
parametres respectifs propres auxdits debits, 
caracterise en ce que, pour un bloc fonctionnel donne, le chemin du treillis 
is choisi est celui traversant le bloc fonctionnel de debit le plus eleve, 

et en ce que les resultats obtenus dudit bloc fonctionnel de debit le plus eleve 
sont adaptes aux debits d'une partie au moins des autres blocs fonctionnels 
par une recherche focaiisee de parametres pour une partie au moins de tous 
les autres blocs fonctionnels, jusqu'au bloc fonctionnel de debit le plus faible. 

20 . 

1 1 Precede selon la revendication 9, prise en combinaison avec la 
revendication 10, caracterise en ce que, pour un debit donne associe aux 
parametres d'un bloc fonctionnel d'un codeur, on utilise le bloc fonctionnel 
operant audit debit donne, en tant que module de calcul, et on adapte 
25 progressivement au moins une partie des parametres propres a ce bloc 
fonctionnel: 

- jusqu'au bloc fonctionnel capable d'operer au debit le plus faible, par 
recherche focaiisee, et 

- jusqu'au bloc fonctionnel capable d'operer au debit le plus eleve, par 
30 recherche focaiisee. 
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12. Procede selon la revendication 1, caracterise en ce que ledit module de 
calcul est un module independant desdits codeurs, et agence pour redistribuer 
des resultats obtenus a I'etape c) a tous les codeurs. 

5 13. Procede selon la revendication 12, prise en combinaison avec la 
revendication 2, caracterise en ce que le module independant et le ou les 
blocs de I'un au moins des codeurs sont agences pour echantjer mutuellement - 
des resultats obtenus a I'etape c), et en ce que le module de calcul est agence 
pour effectuer un transcodage d'adaptation entre blocs fonctionnels de 

io codeurs differents. 

14. Procede selon I'une des revendications 12 et 13, caracterise en ce que le 
module independant comporte un bloc de codage au moins partiel et un bloc 
de transcodage d'adaptation. 
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15. Precede selon Tune des revendications precedentes, dans lequel les 
codeurs en parallele sont agences pour operer en codage multi-modes, 
caracteris6 en ce que I'on prevoit un module de selection a posteriori, capable 
de selectionner un codeur parmi les codeurs. 

16. Procede selon la revendication 15, caracterise en ce que I'on prevoit un 
module de selection partielle, apres chaque etape de codage menee par un ou 
plusieurs blocs fonctionnels, independant des codeurs et capable de 
selectionner un ou plusieurs codeurs. 

17. Procede selon Tune des revendications precedentes, dans lequel les 
codeurs sont de type par transformee, caracterise en que le module de calcul 
comporte un bloc d'allocation de bits, partage entre tous les codeurs, chaque 
allocation de bits effectuee pour un codeur etant suivie d'une adaptation a ce 
codeur notamment en fonction de son debit. 
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18. Procede selon la revendication 17, caracterise en ce que le precede 
comporte en outre une etape de quantification, dont les resultats sontfournis a 
tous les codeurs. 

19. Procede selon la revendication 18, caracterise en ce qu'il comporte en 
outre des stapes communes a tous les codeurs parmi : 

- une1ransform6e temps-frequence(MDCT), - 

- une detection de voisement dans le signal d'entree, 

- une detection de tonalite, 

- la determination d'une courbe de masquage, 

- et un codage d'enveloppe spectrale. 

20. Proced6 selon la revendication 17, dans lequel les codeurs effectuent un 
codage en sous-bande (MPEG-1), caracterise en ce que le procede comporte 
en outre des etapes communes a tous les codeurs parmi : 

- I'application d'un banc de filtres d'analyse, 

- une determination de facteurs d'echelle, 

- un calcul de transformee spectrale (FFT), 

-et la determination de seuils de masquage suivant un modele 
psychoacoustique. 

21. Procede selon I'une des revendications 1 a 16, dans lequel les codeurs 
sont du type a analyse par synthese (CELP), caracterise en ce que le procede 
comporte des etapes communes a tous les codeurs parmi au moins : 

- un pre-traitement, 

- I'analyse de coefficients de prediction lineaire, 

- un calcul de signal d'entree pondere, 

- et une quantification pour au moins une partie des parametres. 
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22. Procede selon la revendication 21, prise en combinaison avec la 
revendication 16, caracteris6 en ce que le module de selection partielle est mis 
en oeuvre apres une etape partag6e de quantification vectorielle pour des 
param^tres & court terme (LPC). 

m m ■ • * 

23. Procede selon la revendication 21, prise en combinaison avec la 
revendication 16, caracterise en ce que le module de selection partielle est mis 
en oeuvre apres une etape partagee de recherche de parametre a long terme 
(LTP) en boucle ouverte. 

24. Produit programme d'ordinateur destine a etre stock6 dans une memoire 
d'une unite de traitement, notamment d'un ordinateur ou d'un terminal mobile, 
ou sur un support memoire amovible et destine a cooperer avec un lecteur de 
Tunite de traitement, 

caracterise en ce qu'il comporte des instructions pour la mise en oeuvre du 
procede de transcodage selon Tune des revendications prec6dentes. 

25. Dispositif d'aide a un codage multiple en compression, codage dans lequel 
un signal d'entree est destin6 a alimenter en parallele une pluralite de codeurs 
comportant chacun une succession de blocs fonctionnels, en vue d'un codage 
en compression dudit signal par chaque codeur, 

caracteris6 en ce qu'il comporte une memoire propre a stacker des instructions 
d ! un produit programme d'ordinateur selon la revendication 24. 

26. Dispositif selon la revendication 25, caracterise en ce qu'il comporte en 
outre un module de calcul independant (Ml) pour la mise en oeuvre du procede 
selon Tune des revendications 12 a 16 et 22, 23- 
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